热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

面经||【字节跳动】Java岗社招面经

一面:1、一些Java基础知识。2、倒排索引。3、讲讲redis里面的哈希表?4、happen-before的规则?5、volatile修饰

attachments-2021-12-MwqT1Wvq61cd1ba7a698f.png

一面:

1、一些Java基础知识。

2、倒排索引。

3、讲讲redis里面的哈希表?

4、happen-before的规则?

5、volatile修饰符,synchronize锁。

6、java单例模式的实现?

7、进程与线程的区别,多进程和多线程的区别?

8、HashMap原理,为什么用红黑树,红黑树的特点?

9、快排时间空间复杂度,最好最坏的情况,优化方案?

10、TCP的拥塞控制,具体过程是怎么样的?UDP有拥塞控制吗?如何解决?

11、讲讲了解的垃圾回收算法和回收器,什么时候执行STOP THE WORLD?

12、了解Go语言吗?

13、问项目相关的东西:负责哪个模块?有没有碰到什么问题?怎么解决的?

二面:

1、Kylin的项目架构。

2、Paxos和ZAB协议。

3、CAP理论,分区容错性的意义。

4、大表Join小表优化,如何处理数据倾斜?

5、讲一下最大堆和最小堆。

6、HDFS的读取、写入,容错处理。(源码)

7、MapReduce的过程。(第一版和第二版的)

8、MR shuffle,Spark shuffle。

9、namenode HA,脑裂,Yarn的调度机制。

10、Hive的内部表和外部表区别、数仓建模模型、数仓分层、雪花模型和星型模型。

11、了解ClickHouse吗?它与Kylin的区别?

三面:

1、LRU算法]实现。(伪代码)

2、链表倒数第K个数。(讲思路)

3、一堆螺丝和螺母用最短时间匹配。(代码实现)

4、求每天浏览页面的新用户。(Hive QL实现)

5、求抖音小视频每日点击量最高的10个。(Hash + 最小堆)


推荐阅读
  • 什么是大数据lambda架构
    一、什么是Lambda架构Lambda架构由Storm的作者[NathanMarz]提出,根据维基百科的定义,Lambda架构的设计是为了在处理大规模数 ... [详细]
  • 从0到1搭建大数据平台
    从0到1搭建大数据平台 ... [详细]
  • 一、Hadoop来历Hadoop的思想来源于Google在做搜索引擎的时候出现一个很大的问题就是这么多网页我如何才能以最快的速度来搜索到,由于这个问题Google发明 ... [详细]
  • 2012年9月12日优酷土豆校园招聘笔试题目解析与备考指南
    2012年9月12日,优酷土豆校园招聘笔试题目解析与备考指南。在选择题部分,有一道题目涉及中国人的血型分布情况,具体为A型30%、B型20%、O型40%、AB型10%。若需确保在随机选取的样本中,至少有一人为B型血的概率不低于90%,则需要选取的最少人数是多少?该问题不仅考察了概率统计的基本知识,还要求考生具备一定的逻辑推理能力。 ... [详细]
  • 字节跳动深圳研发中心安全业务团队正在火热招募人才! ... [详细]
  • HBase在金融大数据迁移中的应用与挑战
    随着最后一台设备的下线,标志着超过10PB的HBase数据迁移项目顺利完成。目前,新的集群已在新机房稳定运行超过两个月,监控数据显示,新集群的查询响应时间显著降低,系统稳定性大幅提升。此外,数据消费的波动也变得更加平滑,整体性能得到了显著优化。 ... [详细]
  • Hudi是一种数据湖的存储格式,在Hadoop文件系统之上提供了更新数据和删除数据的能力以及流式消费变化数据的能力。应用场景近实时数据摄取Hudi支持插入、更新和删除数据的能力。您 ... [详细]
  • Hadoop源码解析1Hadoop工程包架构解析
    1 Hadoop中各工程包依赖简述   Google的核心竞争技术是它的计算平台。Google的大牛们用了下面5篇文章,介绍了它们的计算设施。   GoogleCluster:ht ... [详细]
  • 深入理解Spark框架:RDD核心概念与操作详解
    RDD是Spark框架的核心计算模型,全称为弹性分布式数据集(Resilient Distributed Dataset)。本文详细解析了RDD的基本概念、特性及其在Spark中的关键操作,包括创建、转换和行动操作等,帮助读者深入理解Spark的工作原理和优化策略。通过具体示例和代码片段,进一步阐述了如何高效利用RDD进行大数据处理。 ... [详细]
  • 本文介绍了如何使用Hive分析用户最长连续登录天数的方法。首先对数据进行排序,然后计算相邻日期之间的差值,接着按用户ID分组并累加连续登录天数,最后求出每个用户的最大连续登录天数。此外,还探讨了该方法在其他领域的应用,如股票市场中最大连续涨停天数的分析。 ... [详细]
  • 分布式一致性算法:Paxos 的企业级实战
    一、简介首先我们这个平台是ES专题技术的分享平台,众所周知,ES是一个典型的分布式系统。在工作和学习中,我们可能都已经接触和学习过多种不同的分布式系统了,各 ... [详细]
  • Hadoop + Spark安装(三) —— 调hadoop
    ***************************测试hadoop及问题跟进***************************执行以下语句报错datahadoop-2.9. ... [详细]
  • hive和mysql的区别是什么[mysql教程]
    hive和mysql的区别有:1、查询语言不同,hive是hql语言,MySQL是sql语句;2、数据存储位置不同,hive把数据存储在hdfs上,MySQL把数据存储在自己的系统 ... [详细]
  • hadoop3.1.2 first programdefault wordcount (Mac)
    hadoop3.1.2安装完成后的第一个实操示例程 ... [详细]
  • 【PPT 下载】这杯网红茶饮,到底赢在哪里?
    【PPT 下载】这杯网红茶饮,到底赢在哪里? ... [详细]
author-avatar
噬灬魂鴒
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有